Génération d'images semi-synthétiques de documents anciens

نویسنده

  • Van Cuong Kieu
چکیده

This paper presents a software dedicated to semisynthetic old document image generation and its associated ground truth. This work is thus part of the data generation for document processing algorithm performance evaluation. This software allows a user to specify the content and layout of images to generate (fonts, illustrations, line spacing). Several degradation models were incorporated into the software. It is thus possible to generate images containing defects most commonly seen in old books (ink transparency, character degradation). By generating a huge variety of documents, it is possible to assess the robustness of an algorithm according to these degradations. MOTS-CLÉS : modèle de dégradation d’images de documents, génération de vérité terrain, évaluation de performance, bases de données synthétiques.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Génération de bases de transactions synthétiques : vers la prise en compte des bordures

HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...

متن کامل

Un modèle de bibliothèque numérique collaborative - ARMARIUS

RÉSUMÉ. Les manuscrits anciens numérisés représentent un contenu spécifique pour les bibliothèques numériques. Les utilisateurs travaillant sur ce type de documents ont besoin de systèmes d’assistance et d’espaces de travail collectif pour interpréter, annoter et transcrire ces manuscrits. Dans cet article, nous présenterons un modèle de bibliothèque numérique spécialement conçu pour des manusc...

متن کامل

Système générique et omni-langage de navigation dans des bases de documents anciens basé sur de la recherche de mots par composition intéractive de requêtes

Word retrieval for browsing old digitized document collections is an active field of research. Indeed, because of the bad quality of this type of documents and the use of an ancient language, applying a basic OCR is not enough in general. In order to circumvent these difficulties, we are currently working on a generic, omni-language and interactive word retrieval system for browsing old documen...

متن کامل

Détection et Suivi d'Objets dans une Séquence d'Images par Contours Actifs

Dans cet article, nous proposons une méthode de détection et de suivi d’un objet dans une séquence d’images basée sur le contour actif. Une fonctionnelle d’énergies est attachée au contour actif. Après une initialisation du contour actif dans la première image de la séquence, la minimisation des énergies attachées est utilisé afin de détecter le contour. Puis une initialisation automatique du c...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2012